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Verfahren und System zum automatisierten Erstellen von 
SprachwortschMtzen 

Die Erfindung betrifft ein Verfahren zum Aufbau und/oder zur Erweiterung einer 
Wortschatzdatenbank eines Spracherkennungssystems durch akustisches 
Trainieren des Spracherkennungssystems. Die Erfindung betrifft weiterhin ein 
Spracherkennungssystem mit einer Wortschatzdatenbank. 

Spracherkennungssysteme sind allgemein bekannt und werden mittlerweile in 
verschiedenen Anwendungsgebieten eingesetzt. Beispielsweise kann ein 
Spracherkennungssystem eingesetzt werden, urn in Abkehr von einer manuellen 
Bedienung eine Datenverarbeitungsanlage Oder eine jegliche Maschine mittels 
Sprachbefehlen zu bedienen. 

Ebenso gibt es Anwendungen in Form von sogenannten Diktierprogrammen, bei 
dem ein Spracherkennungssystem die von einem Benutzer in ein Mikrofon 
eingesprochenen Worte analysiert, erkennt und in Textdaten umsetzt, so dass 
hierdurch ein direktes Diktieren von Text in eine Textverarbeitung eines 
Rechnersystems ermoglicht wird. 

Die Grundlage eines jeglichen solchen Spracherkennungssystemes bildet eine 
Wortschatzdatenbank, die fur einen Vergleich des von einem Benutzer 
gesprochenen Wortes mit dem gespeicherten Wortschatz herangezogen wird, um 
mit einer hohen Genauigkeit feststellen zu konnen, welches Wort ein Benutzer 
gesprochen hat und dementsprechend im Text umzusetzen ist. 

Eine derartige Wortschatzdatenbank enthalt nicht die Worte im eigentlichen Sinn, 
sondern Daten/Parameter, die aus gesprochenen Worten ermittelt wurden und 
grundsatzlich von der Art des Erkennungsalgorithmus abhangig sind, der einer 
Spracherkennung zugrunde gelegt wird. 



P02160DE.0P 

2 

So ist es bekannt, verschiedene Methoden der Spracherkennung einzusetzen, die 
beispielsweise haufig auf den sogenannten Hidden-Markov-Modellen oder dem 
^dynamic pattern matching" bzw. „dynamic time warping" beruhen, bei dem ein 
untersuchtes Wort mit Referenzwortern verglichen wird, die im Wortschatz 
5 gespeichert sind. 

Haufig haben die verschiedenen Moglichkeiten der Spracherkennung gemeinsam, 
dass ein erhaltenes Sprachsignal einer akustische Vorverarbeitung unterzogen 
wird, bei der die Worter in Phoneme unterteilt werden, d.h. in sprachlich kleinste 
1 0 Einheiten. Hierzu wird eine funktionelle Analyse der verschiedenen moglichen 
Laute einer Sprache vorgenommen. 

Es konnen z.B. in einem ersten Schritt einer Spracherkennung Kurzzeitspektren 
eines akustischen Signals aufgenommen werden, die in einer Analyse direkt oder 
15 nach einer Datenverarbeitung als Muster dienen fur einen Vergleich mit in einer 
Wortschatzdatenbank abgespeicherten Referenzmustern. 

Unabhangig von der Art des Algorithmus bedarf es dementsprechend immer einer 

Wortschatzdatenbank bzw. deren Parameter mit einem fur den verwendeten 

i 

20 Algorithmus wortschatztypischen Aufbau, die zur Erkennung von gesprochenen 
Worten verwendet wird. Hierbei wird in Verbindung mit 
Spracherkennungsprogrammen oder -systemen ublicherweise eine 
Standardwortschatzdatenbank mitgeliefert, mit der bereits eine hohe 
Erkennungsquote der von einem Benutzer gesprochenen Worte moglich ist. 
25 

Haufig besteht jedoch noch die Notwendigkeit eine Wortschatzdatenbank fur ein 
neues Sprachfeld zu erweitern, insbesondere dann, wenn Fachworte verwendet 
werden, die bislang in der Wortschatzdatenbank hicht zur Verfugung standeh. Zur 
Aufnahme derartiger Fachworte bzw. allgemein von neu zu erlernenden Worten ist 
30 es ublicherweise vorgesehen ein Spracherkennungssystem akustisch zu 
trainierep, was bedeutet, dass dem Spracherkennungssystem die neu zu 
lernenden Worte vorgesprochen werden. Durch Aufnahme dieser neu 
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vorgesprochenen Worte in die Wortschatzdatenbank wird dementsprechend die 
Wortschatzdatenbank kontinuierlich vergroSert, so dass das 
Spracherkennungssystem einen neuen Wortschatz erlemen kann. 

5 Im Stand der Technik ist es bekannt derartige Wortschatzdatenbanken 

ublicherweise durch hohen personellen Aufwand aufzubauen bzw. zu erarbeiten. 
Hierfur werden die neu aufzunehmenden Worte zusammengestellt, bearbeitet und 
in muhevoller personeller Arbeit durch Menschen z.B. in eine akustische 
, Datenbank aufgesprochen, mit der dann ein Spracherkennungssystem auf die 
10 bekannte Art und Weise akustisch trainiert wird. 

Hierbei wird unter einem akustischen Trainieren nicht nur verstanden, dass neu zu 
lemende Worte zunachst in akustische Schallwellen gewandelt werden und uber 
einen Mikrofoneingang einem Spracherkennungssystem zur Verfugung gestellt 
15 werden. Grundsatzlich kann beim akustischen Trainieren eines 

Spracherkennungssystems eine Schallwandlung unterbleiben und dem 
Spracherkennungssystem sofortig die akustischen Daten elektronisch zur 
Verfugung gestellt werden. 

20 Dies ist z.B. der Fall, wenn eine Tonbandaufzeichnung direkt in den 

Mikrofoneingang eines Spracherkennungssystems elektronisch eingespielt wird, 
ohne vorher eine Schallwandlung vorzunehmen. Auch ein derartiges Trainieren 
eines Spracherkennungssystems wird im Sinne dieser Erfindung als akustisches 
Trainieren verstanden, da das Training auf akustischen, wenn auch nur 
25 elektronisch vorliegenden Signalen beruht. 

Das Aufbauen und Erweitern einer Wortschatzdatenbank und deren Parameter, 
wie im Stand der Technik bekannt, stellt dementsprechend einen groBen 
manuellen und personellen Aufwand dar, so dass derartige Datenbanken nur unter 
30 Einsatz grofJer Kosten erstellt, erarbeitet und erweitert werden konnen. 
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Aufgabe der Erfindung ist es ein Verfahren Und ein System zum Aufbau und/oder 
zur Erweiterung einer Wortschatzdatenbank eines Spracherkennungssystems 
bereitzustellen, mit dem auf kostengunstige Art und Weise ohne personellen 
Einsatz eine Wortschatzdatenbank aufgebaut oder eine bestehende erweitert 
5 werden kann. 

Aufgrund des hohen personellen Aufwandes durch viele verschiedene Menschen 
ergeben sich im Stand der Technik auch Probleme im TrainingsprozefJ des 
Spracherkennungssystem, da jeder Mensch ein anderes Stimmbild hat, welches 
10 mit dem der spater bedienenden Person nicht ubereinstimmt. 




Diese Aufgabe wird gemali der Erfindung dadurch gelost, dass das 



Spracherkennungssystem durch ein computergestutztes Audiomodul trainiert wird. 

15 Der Grundgedanke der Erfindung liegt darin, ein Spracherkennungssystem statt 
durch eine Person zu trainieren bzw. die Wortschatzdatenbank durch Personen zu 
erstellen / erweitern, die neu zu erlernenden Worte automatisiert vorzusprechen. 

Gemali der Erfindung ist es vorgesehen, dass dieses Vorsprechen neu zu 
20" erlernender Worte durch ein computergestutztes Audiomodul erfolgt. 

Dementsprechend kann hier der personelle Aufwand minimiert werden, so dass 
die Wortschatzdatenbanken mittels des erfindungsgemaSen Verfahrens aufierst 
^| kostengunstig und standarisiert erstellt werden konnen. 

25 Gemali der Erfindung ist es bevorzugt vorgesehen, dass dem Audiomodul 
Wortschatzinformationen zugefuhrt werden, die das Audiomodul dem 
Spracherkennungssystem automatisch zur Erweiterung der Wortschatzdatenbank 
vorspricht. Wie oben erwahnt, setzt dieses Vorsprechen nicht notwendigerweise 
eine Wandlung der Wortschatzinformationen mittels eines Lautsprechersystems in 

30 Schall voraus, der dann anschlieftend mit einem Mikrofonsystem wiederum in ein 
elektrisches Signal gewandelt wird, sondern es besteht auch hier die Moglichkeit 
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die Schallwandlung zu umgehen und sofortig das akustische elektrische Signal 
dem Spracherkennungssystem zur Verfugung zu stellen. 

Besonders bevorzugt wird bei dem erfindungsgemaden Verfahren das Audiornodul 
5 die Wortschatzinformationen von einer Sprachdatenbank und/oder uber ein 
Telekommunikationsnetzwerk erhalten. Gerade bei einer Lieferung der 
Wortschatzinformationen uber ein Telekommunikationsnetzwerk besteht 
beispielsweise die Moglichkeit im sogenannten streaming modus die Daten zur 
Verfugung zu stellen. Dies kann beispielsweise uber das Internet erfolgen, wenn 

10 z.B. Radiosendungen uber das Internet empfangen werden. So besteht z.B. die 
Moglichkeit uber das Internet das in einer Radiosendung verwendete 

0 Fachvokabular zu einem bestimmten Thema einem Spracherkennungssystem 
automatisch beizubringen, indem diese Streamingdaten dem Audiornodul zur 
Verfugung gestellt werden, welches sodann automatisch diese Sprachdaten dem 

1 5 Spracherkennungssystem vorspricht. 

In einer weiteren bevorzugten Ausfuhrung des erfindungsgemaUen Verfahrens 
kann es vorgesehen sein, dass die genannte Sprachdatenbank durch eine 
automatisierte Sprachsynthese von Textinformationen in einer 
Sprachsyntheseeinheit erzeugt wird. Hierbei konnen die Textinformationen z.B. 
einer Textdatenbank entnommen werden. Es besteht somit die Moglichkeit auf 
beliebige bestehende Textdatenbanken Ruckgriff zu nehmen und die darin 
gespeicherten Textdaten durch eine Sprachsyntheseeinheit in 
Sprachinformationen umzuwandeln, die sodann in eine Sprachdatenbank 
eingeschrieben werden, welche ihrerseits dann wiederum dem 
Spracherkennungssystem zum Training zur Verfugung gestellt wird, wofur die in 
der Sprachdatenbank gespeicherten Sprachdaten z.B. uber das Audiornodul dem 
Spracherkennungssystem vorgesprochen werden. 



20 



25 



30 



In einer besonders bevorzugten Ausfuhrung kann das Audiornodul eines 
Spracherkennungssystems selbst eine derartige Sprachsyntheseeinheit umfassen, 
so dass Textinformationen, insbesondere aus einer Textdatenbank, direkt von dem 
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Spracherkennungssystem in Sprachinformationen gewandelt werden konnen, urn 
anhand dieser Informationen das Training und somit die Erweiterung der 
Wortschatzdatenbank durchzufuhren. 

5 Die kunstliche Sprachsynthese hat hier den Vorteil, dass das 

Spracherkennungssystem die Wortschatzinformationen immer mit einer 
„genormten" Stimme vorgesprochen erhalt, so dass weniger Probleme beim 
akustischen Trainieren vorkommen. Hierbei kann es vorgesehen sein, dass der 
Sprachsyntheseeinheit bestimmte gewunschte Sprach-Parameter bzw. Stimm- 
10 Parameter vorgegeben werden, z.B. hinsichtlich Geschlecht, der kunstlichen 

Stimme, Alter, Korperbau, Dialekt, etc., urn eine moglichst nahe Anpassung an den 
j/L . spateren tatsachlichen Benutzer des Spracherkennungssystems zu erreichen. 



Visuelle textliche Informationen konnen dem System automatisiert vorgegeben 
15 werden, z.B. durch ein Einscannen von Textdarstellungen. 

Neben der Moglichkeit vorhandene Textdatenbanken einzusetzen, kann das 
erfindungsgemafte Verfahren auch derart durchgefuhrt werden, dass die 
Textinformationen der Sprachsyntheseeinheit von einer automatisch erzeugten 
20 Textdatenbank zugefuhrt werden. 

Eine derartig automatisch erzeugte Textdatenbank kann fur einen spezifischen Fall 
m automatisch generiert werden, beispielsweise wenn Vokabular einer bestimmten 



Fachrichtung gezielt dem Spracherkennungssystem beigebracht werden soil. 
25 Hierfur kann es gemafi dem erfindungsgemaSen Verfahren bevorzugt vorgesehen 
sein, dass in der Textdatenbank automatisch die Textdaten zu wenigstens einer 
Textdatenquelle gespeichert werden, die uber wenigstens eine Suchmaschine in 
einem internen Oder externen Telekommunikationsnetzwerk, insbesondere dem 
Internet, zu wenigstens einem vorgegebenen Suchbegriff ermittelt werden. 





30 



Bekannt ist es, dass z.B. im Internet als einem moglichen externen 
Kommunikationsnetzwerk durch Eingabe eines gewunschten Suchbegriffes in 
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einer Suchmaschine eine Vielzahl sogenannter Links aufgefunden werden, unter 
denen Textdaten zu finden sind, die in engem Zusammenhang mit dem 
eingegebenen Suchbegriff stehen. Insofern konnen auf diese Art und Weise sehr 
schnell und vor alien Dingen kostengunstig erhebliche, z.B. statistisch relevante 
5 Mengen von Textdaten aufgefunden werden, die thematisch mit dem Suchbegriff 
in Verbindung stehen und im Rahmen des erfindungsgemaSen Verfahrens dem 
Spracherkennungssystem zum Training zur Verfugung gestellt werden. 

Hierfur kann es vorgesehen sein, dass durch eine Datenverarbeitungsanlage, 
10 gegebenenfalls durch das Spracherkennungssystem selbst, automatisch die 
Textdaten von den ermittelten Textdatenquellen, also im Internet z.B. unter den 
verlinkten Adressen, gelesen und in der Textdatenbank gespeichert werden. So 
wird auf einfache und schnelle Art und Weise eine sehr grolie Textdatenbank 
aufgebaut, deren Inhalt mit dem Suchbegriff korreliert. 

15 

Da diese Textdaten gegebenenfalls auch solche Daten umfassen, die keinen 
Beitrag zur Wortschatzdatenbank liefern sollen, wie beispielsweise ubliche 
Fullworte oder Standardvokabular, kann es vorgesehen sein, dass die Textdaten in 
der Textdatenbank vor einer Sprachsynthese analysiert und bearbeitet werden. 

20 Neben dem Entfernen von Fullworten kann es auch vorgesehen sein z.B. 

Mehrfachnennungen aus der Textdatenbank zu streichen und auch Informationen 
hinsichtlich einer Haufigkeitsverteilung bestimmter Worte zu erstellen, wobei diese 
Informationen ebenfalls in den Trainingsprozess des Spracherkennungssystems 
mit einfliefien konnen, ebenso wie Informationen uber Wahrscheinlichkeiten, mit 

25 denen bestimmte Textdaten untereinander in Verbindung stehen. 

So ist es beispielsweise bekannt bei einer Spracherkennung auch eine sogenannte 
Kontextprufung durchzufuhren, bei der ermittelt wird, mit welcher 
Wahrscheinlichkeit auf ein ermitteltes Wort ein anderes Wort folgt, urn aus 
30 mehreren moglichen Varianten eine sinnvolle Variante herauszusuchen. Dies wird 
beispielsweise durchgefuhrt, urn Probleme mit Homophonen zu vermeiden, d.h. 
mit Worten, die gleich klingen, aber unterschiedliche Bedeutung haben. 
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Derartige Informationen z.B. uber Kontextwahrscheinlichkeiten oder auch andere 
weitere Informationen jeglicher Art konnen gemaR der Erfindung vor der 
Durchfuhrung einer Sprachsynthese aus den ermittelten Textdaten gewonnen und 
5 erganzend einem Spracherkennungssystem zur Verfugung gestellt werden. 

Gemafc der Erfindung umfasst dementsprechend im einfachsten Fall ein 
Spracherkennungssystem eine Wortschatzdatenbank sowie eine 
Sprachsyntheseeinheit, der zum Aufbau und/oder zur Erweiterung der 
10 Wortschatzdatenbank durch ein akustisches Vorsprechen Textdaten aus einer 

Textdatenbank zufuhrbar sind, wobei diese Textdatenbank erfindungsgemaS durch 
x eine automatische Suche nach Textdaten zu einem vorgegebenen Suchbegriff in 
einem Telekommunikationsnetzwerk generiert ist. 

15 Ein Ausfuhrungsbeispiel der Erfindung ist in den nachfolgenden Zeichnungen 
naher erlautert. Es zeigen: 

Figur 1 ein Spracherkennungssystem mit einem Anschluss an das Internet; 

20 Figur 2 eine genauere schematische Darstel lung eines 
Spracherkennungssystems 




Die Figur 1 zeigt ein Spracherkennungssystem 1 , welches Zugriff auf eine 



Wortschatzdatenbank 2 hat und von einem Benutzer 3 bedient wird. Ein derartiges 
25 System kann z.B. durch einen Heim-PC mit einem Diktierprogramm gebildet sein. 

Neben der hier nicht weiter erlauterten Moglichkeit zur Spracherkennung z.B. im 
Rahmen einer Diktierfunktion innerhalb eines Textverarbeitungsprogramms ist 
gemaft der Erfindung das Spracherkennungssystem 1 uber entsprechende 
30 Telekommunikationsleitungen mit dem Internet 4 verbunden. 
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Mochte nun ein Benutzer 3 den Sprachwortschatz in der Wortschatzdatenbank 2 
z.B. durch spezifisches Fachvokabular erweitern, so kann der Benutzer 3 z.B. uber 
ein Computerterminal dem Spracherkennungssystem einen Suchbegriff vorgeben, 
der in dem entsprechenden, neu zu erlernenden Fachbereich typisch ist. Uber das 
5 erfindungsgemaUe Spracherkennungssystem 1 wird mittels des Internets 4 z.B. 
eine erste Suchmaschine 5 angesprochen, in die der Suchbegriff eingetragen wird, 
woraufhin die Suchmaschine 5 im Internet bzw. in einer ihr zugeordneten 
Datenbank 6 nach Textdaten bzw. Hyperextdaten sucht, in denen der Suchbegriff 
vorkommt, woraufhin diese Textdaten ebenfalls wiederum uber das Internet dem 
1 0 Spracherkennungssystem zur Verfugung gestellt werden. 

£ Hier kann es auch vorgesehen sein, dass das Spracherkennungssystem 1 uber 
das Internet zunachst eine zentrale Suchmaschine 7 mit der Suche nach dem 



gewunschten Begriff beauftragt, die ihrerseits auf mehrere Datenbanken 8 und 9 
1 5 Zugriff hat und daruber hinaus noch weitere dezentrale Suchmaschinen 1 0 und 1 1 
beauftragt, die ihrerseits in entsprechend zugeordneten Datenbanken nach dem 
Suchbegriff recherchieren. So kann also auch durch das Spracherkennungssystem 



weitere Suchmaschinen unterverteilt. 

20 

Die insgesamt erhaltenen Textdatenmengen konnen dezentral oder auch zentral 
im Spracherkennungssystem gesammelt werden und gegebenenfalls nach einer 



tyi, Vorverarbeitung zum Trainieren des Spracherkennungssystems mittels einer 

Sprachsyntheseeinheit herangezogen werden. Dieses Vorgehen ist in der Figur 2 
25 naher erlautert. 

GemalJ der Figur 2 kann ein Benutzer 3 uber ein Computersystem 12 eine 
Suchbegriffsanfrage starten z.B. uber eine Telekommunikationsverbindung in das 
Internet 4 an eine oder mehrere Suchmaschinen 5, die z.B. Dantenbanken 6 . 
30 Zugriff haben. 



eine sogenannte Meta-Suchmaschine beauftragt werden, die die Suche auf 
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Die ermittelten Textquellen, im Internet als Links bezeichnet, werden gemafc dem 
erfindungsgemaUen Verfahren z.B. bevorzugt durch das Computersystem 12 
automatisch aufgerufen, so dass die darin enthaltenen Textdaten gesammelt und 
in eine Textdatenbank 13 ubermittelt werden konnen, wo diese Textdaten 
5 gesammelt und gegebenenfalls uberarbeitet werden, z.B. in dem Sinne, dass 
Fullworte gestrichen, Mehrfachnennungen eliminiert und gegebenenfalls 
Kontextzusammenhange festgestellt werden. 

Die gesammelten, in der Textdatenbank 13 vorgehaltenen Textdaten konnen 
1 0 sodann einer Sprachsyntheseeinheit 1 4 zugefuhrt werden, wodurch die Textdaten 

in Sprachinformationen konvertiert werden und in der Datenbank 2 abgelegt 
£ werden. 

Nach dieser Sprachkonversion erfolgt die eigentliche Lernphase, d.h. dem 
15 Spracherkennungssystem 1 werden intern gegebenenfalls ohne eine 

Schallwandlung nur auf elektronischem Wege die Sprachdaten aus der Datenbank 
2 vorgesprochen, wobei eine interne Datenbank des Spracherkennungssystem 1 
erweitert wird. 

20 Die einzelnen Elemente 1, 12, 13, 14 und 2 konnen auch zu einem Modul 15 
zusammengefasst werden. 



</J^ Das erfindungsgemalie Verfahren bietet dementsprechend zusammenfassend 

eine sehr kostengunstige Moglichkeit eine bestehende Wortschatzdatenbank eines 
25 Spracherkennungssystems bzw. eine neu aufzubauende Wortschatzdatenbank zu 
generieren, in dem automatisch auf eine Fulle von Textdaten der entsprechenden 
Datenbanken Ruckgriff genommen wird, wobei diese Textdaten bevorzugt durch 
eine Sprachsyntheseeinheit dem Spracherkennungssystem vorgesprochen 
werden, um den Lernprozess auszufuhren. 




30 
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Patentanspruche 

1 . Verfahren zum Aufbau und/oder zur Erweiterung einer Wortschatzdatenbank 
(2) eines Spracherkennungssystems (1 ) durch akustisches Trainieren des 
Spracherkennungssystems (1), dadurch gekennzeichnet, dass das 
Spracherkennungssystem (1) durch ein computergestutztes Audiomodul 
trainiert wird. 

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass dem Audiomodul 
Wortschatz-Informationen zugefuhrt werden, die das Audiomodul dem 
Spracherkennungssystem (1 ) automatisiert zur Erweiterung der 
Wortschatzdatenbank (2) vorspricht. 

3. Verfahren nach einem der vorherigen Anspruche, dadurch gekennzeichnet, 
dass das Audiomodul die Wortschatz-Informationen von einer 
Sprachdatenbank und/oder uber ein Telekommunikationsnetzwerk (4), 
insbesondere im Streaming-Modus, erhalt. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die 
Sprachdatenbank durch automatisierte Sprachsynthese von Textinformationen 
in einer Sprachsynthese-Einheit (14), insbesondere aus einer Textdatenbank 
(13), erzeugt wird. 

5. Verfahren nach einem der vorherigen Anspruche, dadurch gekennzeichnet, 
dass das Audiomodul eine Sprachsynthese-Einheit (14) umfasst, die 
Textinformationen, insbesondere aus einer Textdatenbank (13), in 
Sprachinformationen wandelt. 

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die 
Textinformationen der Sprachsynthese-Einheit (14) von einer automatisch 
erzeugten Textdatenbank (13) zugefuhrt werden. 
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Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass in der 
Textdatenbank (13) automatisch die Textdaten zu wenigstens einer 
Textdatenquelle gespeichert werden, die uber wenigstens eine Suchmaschine 
(5,7,10,1 1) in einem internen oder externen Telekommunikationsnetzwerk (4), 
insbesondere dem Internet, zu wenigstens einem vorgegebenen Suchbegriff 
ermittelt werden. 

Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass durch eine 
Datenverarbeitungsanlage automatisch die Textdaten von den ermittelten 
Textdatenquellen gelesen und in der Textdatenbank (13) gespeichert werden. 

Verfahren nach einem der vorherigen Anspruche, dadurch gekennzeichnet, 
dass die Textdaten in der Textdatenbank (13) yor einer Sprachsynthese (14) 
analysiert und bearbeitet werden. j 

10. Spracherkennungssystem mit einer Wortschatzdatenbank, gekennzeichnet 
durch eine Sprachsynthese-Einheit (14), der zurh Aufbau und/oder zur 
1 5 Erweiterung der Wortschatzdatenbank (2) durch akustisches Vorsprechen 
Textdaten aus einer Textdatenbank (13) zufuhrbar sind, die durch eine 
automatische Suche nach Textdaten zu einem vorgegebenen Suchbegriff in 
einem Telekommunikationsnetzwerk (4) generiert ist. 




25 
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Zusamrnenfassung 

Die Erfindung betriftt ein Verfahren zum Aufbau und/oder zur Erweiterung einer 
Wortschatzdatenbank (2) eines Spracherkennungssystems (1) durch akustisches 
Trainieren des Spracherkennungssystems (1), bei dem das 
Spracherkennungssystem (1) durch ein computergestutztes Audiomodul trainiert 
wird. Die Erfindung betrifft weiterhin ein Spracherkennungssystem mit einer 
Wortschatzdatenbank, und einer Sprachsynthese-Einheit (14), der zum Aufbau 
und/oder zur Erweiterung der Wortschatzdatenbank (2) durch akustisches 
Vorsprechen Textdaten aus einer Textdatenbank (13) zufuhrbar sind, die durch 
eine automatische Suche nach Textdaten zu einem vorgegebenen Suchbegriff in 
einem Telekommunikationsnetzwerk (4) generiert ist. 



Figur 1 
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